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摘 要 : 开展 干旱 预测 是 有 效应 对 干旱 风险 的 前 提 基 础 。 利 用 1958 一 2017 年 青海 省 38 个 气象 站 点 
逐日 降水 量 数据 计算 多 尺度 标准 化 降水 指数 (SP1) ,并 建立 了 SPI 序 列 自 回归 移动 平均 模型 (ARI- 
MA) 长短 时 记忆 神经 网 络 模型 (LSTM) 和 基于 二 者 优点 提出 的 ARIMA-LSTM 组 合 模型 ;对 模型 参数 
进行 率 定 和 验证 后 ,利用 所 建立 的 模型 ,以 西宁 站 点 为 例 , 对 多 尺度 SP1T 值 进行 预测 ,借助 均 方 根 误差 
(CRHMSE)、 平 均 绝对 百分比 误差 (NM4PP) 和 决定 系数 屁 对 所 有 预测 模型 的 有 效 性 进行 判定 。 结 果 表 
明 :ARIMA-LSTM 4 AW Xl E SPI fa SPIA2 f; RMSE (& 47 51 X 0.159 7 120.181 0, 均 低 于 ARIMA 模 
Al H9 1.265 4 $2 0.293 3, 3, 9] ARIMA ŽA! 5 ARIMA-LSTM 组 合 模 型 对 SPI 的 预测 精度 都 与 时 间 尺 度 
有 关 ,ARIMA 模型 的 预测 精度 随 着 时 间 尺 度 的 增加 而 逐渐 提高 ;结合 GIS 并 利用 实测 数据 与 模型 的 
预测 数据 相 比较 说 明 ARIMA-LSTM 组 合 模 型 相 比 于 单一 ARIMA 模型 的 预测 精度 更 高 ,上 且 能 够 很 好 


拟 合 不 同时 间 尺 度 的 SPI 值 。 
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早 是 最 和 常见、 最 复杂 的 目 然 灾害 之 一 ,也 是 
对 人 类 社会 影响 最 为 严重 的 气象 灾害 之 一 ，。 相 
较 于 其 他 日 然 灾 害 ,干旱 发 展 缓慢 ,特征 不 易 量 化 ， 
影响 方式 直接 ,人 危害 面积 较 大 ”。 干旱 是 指 水 分 收 
文 或 供求 不 平衡 形成 的 水 分 短缺 现象 ”。 干 旱 作 
为 一 种 气象 灾害 ,长 期 困扰 着 工农 业 生 产 “。 TF 
程度 常 利 用 干旱 指数 进行 定量 评价 ”“。 干 旱 指 数 
是 干旱 灾害 量化 和 评估 人 研究 的 基础 之 一 “ ,国内 外 
常用 的 分 析 指 数 有 :Palmer 干 旱 指 数 (PDST) "^, 
标准 化 降水 指数 (SP1)” ”综合 气象 干旱 指数 (C7) 
等 %。 其 中 ,SPI 适 用 范围 广 ,易于 计算 ,因此 ,成 为 
在 实际 运用 当中 最 广泛 并 且 适 用 于 所 有 气候 的 干 
量 指标 o TRM AHAA EENE SPE 
并 结合 游程 理论 来 分 析 黑 龙 省 干旱 的 时 空 演变 特 
征 ,对 历史 的 连 旱 期 以 及 干旱 频率 强度 的 趋势 进行 
了 探究 ,发 现 SP17 能 够 较 好 监测 历史 旱情 。 


收 稿 日 期 : 2019- 11-05; 修订 日 期 : 2020 -06 - 08 
基金 项 目 : 国家 自然 基金 (51679089 .51609082 .51709107) 资 助 


目前 ,ARIMA、 人 工 神经 网 络 (ANN) 支持 向 量 
机 (SVM) 是 常见 的 干旱 预测 模型 的 。 其 中 ARIMA 
模型 是 常用 的 数据 驱动 模型 ,多 用 来 拟 合 并 预测 时 
间 序 列 数据 , 韩 萍 等 "利用 ARIMA 模 型 预测 了 多 个 
时 间 尺 度 的 SP1, 并 对 多 尺度 SPI 的 预测 精度 进行 了 
对 比 ;ANN 模 型 被 杨 莫 茶 等 ”用 来 和 ARIMA 模型 
进行 对 比 ,通过 ARIMA FI ANN 模型 对 SPEI 进 行 预 
测 ,并 将 实际 值 与 预测 值 进行 对 比 ,发 现 两 种 预测 
模型 对 不 同时 间 尺 度 的 SPEI 预 测 精 度 不 同 。 目 前 
的 文章 大 多 以 ARIMA 为 主 的 线性 模型 和 ANN 为 主 
的 非 线性 模型 来 预测 干旱 指数 的 时 间 序 列 ,其 中 线 
性 模型 和 非 线性 模型 各 有 利 整 ,由 于 线性 模型 不 能 
识别 非 线性 特征 , 而 非 线性 模型 不 能 识别 线性 特 
征 ,因此 本 文 利用 线性 模型 和 非 线性 模型 组 合 来 预 
测 干旱 情况 , 即 ARIMA-LSTM 组合 模 型 。 相 比 于 前 
人 的 研究 ,本 文选 取 的 LSTM 模型 在 预测 长 期 数据 
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的 情况 下 优 于 传统 的 ANN 模 型 。LSTM 模型 是 循环 
神经 网 络 模型 (RNN ) 的 拓展 ,其 中 RNN 相 比 于 ANN 
在 神经 元 的 隐藏 导数 上 要 多 ,并 且 RNN 能够 通过 先 
前 的 事件 推断 后 续 事 件 , 即 RNN 最 大 的 优点 是 具有 
记忆 功能 ;但 随 着 事件 的 时 间 间 隔 不 断 增 大 时 , 
RNN 会 丧失 它 的 学 习 能 力 , 又 因为 RNN 在 模型 训练 
时 存在 梯度 消失 和 梯度 爆炸 问题 导致 很 难 应 用 在 
解决 实际 问题 上 。 而 LSTM 则 是 RNN 的 变 体 , 通 
过 加 入 三 种 特殊 的 门 层 (遗忘 门 , 输 入门 ,输出 门 ) 
来 确定 细胞 状态 中 丢弃 什么 样 的 信息 、 更 新 什么 样 
的 信息 和 输出 什么 样 的 信息 ,因此 在 长 期 记忆 中 优 
于 RNN; 同 时 ,LSTM 通过 添加 正则 项 和 激活 函数 
来 避免 梯度 消失 和 爆炸 ,近年 来 LSTM 也 成 功 地 应 
用 于 自然 语言 处 理 和 时 间 序 列 预测 领域 。 
ZHANG 等 为 了 预测 长 期 地 下 水 位 深度 而 开发 了 
LSTM 模 型 ,利用 决定 系数 (R) 等 模型 评价 指标 对 预 
测 绪 果 进 行 评价 并 取得 了 较 好 的 效果 ,证 明了 该 模 
型 能 够 较 好 地 保存 和 学 习 以 往 的 信息 ,并 发 现 该 模 
型 可 以 作为 长 期 预测 地 下 水 位 深度 的 男 一 种 方法 。 

本 研究 通过 青海 省 1958 一 2017 年 的 38 个 气象 
站 点 降水 量 数据 来 计算 多 尺度 SPI 值 ,由 于 气象 站 
点 过 多 ,因此 仪 以 西宁 站 为 例 进 行 ARIMA 和 LSTM 
建 模 过 程 展示 。 并 以 三 种 模型 评价 指标 对 两 种 模 
型 预测 精度 进行 评价 ,结合 ArcGIS 的 样 条 函数 插值 
法 对 青海 省 2017 年 的 SPI1 实 际 值 与 模型 预测 值 进行 
可 视 化 展示 与 分 析 。 


90? E 95° E 


图 例 
e ”气象 站 点 


河流 S 


90° E 95° E 


1 研究 区 概况 


近年 来 全 国 旱 洲 灾害 频 发 ,西北 干旱 地 区 更 是 
首当其冲 ”。 青 海 省 地 势 总 体 呈 西高 东 低 ,西部 海 
拔高 峻 , 癌 东 倾斜 , 呈 梯 形 下 降 , 东 部 地 区 为 青藏 高 
原 疝 黄土 高 原 过 渡 地 带 , HE RE jS, HA TEC. 
全 省 属于 高 原 大 陆 性 气候 ,是 全 球 同 纬度 最 干旱 的 
地 区 之 一 ,同时 这 里 受 西 风 带 气候 、 高 原 季 风 和 
东亚 季风 气候 影响 ,降水 变 率 大 ,干旱 频率 高 ,是 我 
国 气候 变化 的 敏感 区 和 生态 脆弱 区 ”。 本 文 以 青 
海 省 为 例 ,利用 机 天 学 习 模 型 对 研究 区 干旱 情况 进 
行 分 析 预 测 。 


2 数据 及 方法 


2.1 数据 来 源 

图 形 数据 包括 :1. 青 海 省 行政 区 划 图 ;2. 青 海 省 
水 系 图 ;3. 青 海 省 土地 利用 图 。 表 格 数 据 包 括 :1. 各 
市 降水 量 数据 (青海 省 统计 年 鉴 );2. 青 海 省 气象 站 
点 数据 ;3. 气 象 站 点 逐日 降水 量 数据 。 本 文选 用 
1958—2017 年 青海 省 境内 38 个 监测 连续 的 气象 站 
数据 来 自 中 国 气象 数据 网 (http://data.cma.cn/)。 
2.2 研究 方法 
2.2.1 标准 化 降水 指数 (SP1) ”SPJ 是 由 美国 科学 
Z MCKEE 55" 5; 1993 年 开发 的 一 种 多 时 间 尺 度 的 
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图 1 青海 省 气象 站 点 分 布 与 研究 区 划 图 


Fig. 1 Meteorological station distribution and study area map of Qinghai Province 
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干旱 指数 ,采用 Gamma 函数 来 描述 降水 量变 化 ,只 
需 降水 量 即 可 计算 ,通过 干旱 指数 值 可 判别 是 否 发 
EPR”, 


SPT 指 数 公式 为 : 
= à 
npud (ust * u)t * u, w 
Kt b) Los 1 
1 
ie : (2) 
Y(s) 


式 中 : Y(x) 为 与 [函数 相关 的 降水 量 分 布 概率 ;x 为 
样本 值 ( 即 降水 量 );C 为 正 负 系数 ju 和 1 
为 常数 : 

uo=2.515 517 w=0.802 853 w=0.010 328 

/=1.432 788 120.189 269 l=0.001 308 
M Y(x) » 0.5B],G-1, 24 Y(x) «0.5 B] ,G—-1; 
Y(x) 由 [函数 概率 密度 积分 公式 求 得 ,公式 为 : 
Y(x)- gagh ds >0 (3) 

式 中 :y, B 为 1 分 布 函数 的 形状 和 尺度 参数 。 

本 文 计算 了 1958 一 2017 年 的 4 个 月 尺度 的 SPI 
值 ( 分 别 为 1 个 月 .3 个 月 .6 个 月 和 12 个 月 ) ,并 利用 
干旱 分 级 表 ( 表 1) 来 表征 干旱 情况 。 


表 1 标准 化 降水 指数 干旱 分 级 
Tab.1 Drought classification based on SPI 


等 级 类 型 SPI 范 围 
1 pr -0.5 < SPI 
2 轻 旱 -1.0 < SPIS -0.5 
3 rp -1.5 < SPIS -1.0 
4 重 早 -2.0< SPI<-1.5 
5 TEE SPI«-2.0 


2.2.2 ARIMA €! ARMA 模 型 由 下 式 表 示 29， 

Y, -QY, t pg Serpent c 0,6, :一 (4) 

记 作 ARIMA(p,d,q)s Xil tab XyS T B, M 
ARIMA(p,d,q)Jr feu] ftl i y : 

o, ( B)A'Y, - 0,(B)e, (5) 


0,6, ;—**0 6. 


其 中 : 
B= SO gD (6) 
0(B)-1- B0,- B'0,—- ---B'0, (7) 
式 中 :了 为 时 间 序 列 值 ;qi(i= 1,2,…,p) 和 06; G7 1, 
2,…,g) 分 别 为 自 回 归 系 数 和 滑动 平均 系数 ;e 为 日 


噪声 序列 ,上 且 e~ N(0,o)。 选 取 1958 一 1995 年 数 
据 作 为 训练 集 ,1996 一 2017 年 数据 作为 测试 集 。 
2.2.3 LSTM & 3! LSTM 是 RNN 的 一 种 拓展 , 结 
构 见 图 2。 LSTM 与 RNN 最 大 的 不 同 在 于 隐藏 模块 
中 添加 了 三 个 门 层 ,分 别 是 忘记 门 (Forsget gate) 、 输 
AT ] (Input gate) 和 输出 门 (Output gate) ”。 忘 记 门 
决定 什么 样 的 信息 保留 ,什么 样 的 信息 遗忘 ;输入 
门 用 来 更 新 细胞 状态 ,决定 什么 信息 我 们 需要 更 
新 ;输出 门 是 一 个 过 滤器 ,基于 当时 的 细胞 状态 来 
选择 哪个 部 分 用 来 输出 。 其 中 LSTM 隐藏 层 结 构 如 
图 3 所 示 。 


(—69——(95 
sm * [anh 
MZ NEC A 
o tanh |O | 
: x e 


图 2 LSTM 模 型 结构 图 
Fig.2 Structure diagram of LSTM model 


9 


与 时 间 间 隔 相 关 
分 支点 
汇总 点 


输入 汇聚 点 
OL 5 


图 3 LSTM 隐藏 层 细胞 结构 
Fig. 3 LSTM cell structure in hidden layer 


本 文 利用 LSTM 对 多 时 间 尺 度 SPI 序 列 的 ARI- 

MA 预测 残 差 进行 拟 合 ,由 于 LSTM 的 隐 含 层 数 量 决 

定 了 模型 拟 合 能 力 ,为 了 防止 过 拟 合 ,本 文 提 出 了 

“ 早 停 法 ”, 即 当 损 失 响 数 不 再 下 降 时 停止 训练 。 损 
RRUGE XH F : 

LOSS = Y. -$y) (8) 


izi 
式 中 :是 在 时 间 i 处 的 观测 值 ; 了 ,是 在 时 间 i 处 的 巴 
测 值 。 
本 文 基于 Python3.7 平 台 来 搭建 LSTM 网 络 , 采 
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用 基于 时 间 的 反 向 传播 算法 进行 训练 。batch_size 
设置 为 1, 其 中 1 代表 在 每 个 样本 之 后 更 新 权重 ,该 
过 程 称 为 随机 梯度 下 降 (SGD)。 激 活 函 数 通 常 有 
sigmoid tanh 和 relu, 由 于 sigmoid 在 反问 传播 时 很 容 
易 出 现 梯 度 消失 情况 ,而 tanh 的 SGD 收敛 速度 太 
慢 , 因 此 本 文选 用 relu 做 激活 函数 。 由 于 本 文选 用 
“ 星 停 法 ”来 防止 训练 过 拟 合 ,该 方法 选取 均 方 误差 
(MSE ) 作 为 损失 消 数 ,损失 也 数 越 小 ,说 明 预 测 模 型 
精度 越 高 , 随 着 迭代 次 数 不 断 增加 时 MSE 值 逐渐 下 
降 , 直 到 某 一 时 刻 MSE 值 上 升 时 说 明 模 型 过 拟 合 ， 
因此 早 停 法 在 模型 MSE 值 上 升 前 一 刻 停止 训练 以 
保证 预测 模型 的 精度 达到 最 高 。 壕 代 次 数 本 文 设 
置 为 300 次 ,以 保证 MSE 能 降 到 最 低 。 对 于 LSTM 
网 络 而 言 ,神经 元 隐藏 层 数量 决定 着 网 络 训练 速度 
与 预测 精度 ,隐藏 层 数 量 太 少 , 导 致 网 络 无 法 训练 
或 效果 很 差 ,隐藏 层 数 量 过 大 又 导致 网 络 训练 速度 
慢 或 者 出 现 过 拟 合 现象 。 本 文采 用 黄金 分 割 法 来 
选择 隐藏 层 神经 元 数量 。 黄 金 分 割 法 是 指 在 区 间 
[a ,0 中 找到 理想 的 隐 含 层 节 点 个 数 ,然后 根据 黄金 
4j $8 JE EE d e 488 8 pe qa] , 即 得 到 区 间 [o,c]Lp= 
0.619x(c-a)-*a Jo 
2.2.4 ARIMA-LSTM 组 合 模型 ”由 于 ARIMA 模 
型 是 常见 的 线性 预测 模型 ,而 LSTM 模型 则 相反 。 
本 文 利用 ARIMA 模型 来 预测 线性 特征 (Y) ,利用 
LSTM 模 型 来 预测 非 线 性 特征 (L) ,最 后 将 线性 特征 
与 非 线 性 特征 相 结 合 得 到 组 合 模 型 。 即 : 

Y Lo (9) 
2.2.5 评价 验证 指标 本 文选 取 均 方 根 误 差 
(RMSE) .平均 绝对 百分比 误差 (MAPE) 和 尺 作 为 模 
型 评价 指标 ” ,其 中 尼 的 取 值 范围 通常 在 [0,1] , 结 
果 越 接近 1 说 明 拟 合 效果 越 好 。 

(1) RMSE 均 方 根 误差 


(2) MAPE 平 均 绝 对 百 分 误 差 


Xi; — yi 100 
- > L (11) 


RMSE = Im -yp (10) 


MAPE= V. 
i=l 


(3) RERI 


R= l izl (12) 


je 


XCHP ios Je XUI EE sy; ie UU EE ; y y B T EL G= 


1,…,N);N 是 样本 数 。RMSE RI MAPE RRIA 0, K 
示 预 测 值 与 观测 值 越 接近 , 尼 值 越 接 近 1 MAE 
效果 越 好 。 


3 结果 与 分 析 


3.1 ARIMA 建 模 流程 

3.1.1 平稳 化 处 理 及 ARIMA 模型 定 阶 本文 以 
西宁 站 为 例 对 ARIMA 进行 建 模 。 首 先 采 用 单位 根 
检验 (ADF) 来 判断 模型 的 平稳 性 , 若 计算 所 得 己 < 
0.05( 显 若水 平 w = 0.05) 则 为 平稳 时 间 序 列 ,计算 结 
果 见 表 2。 由 于 表 2 中 ,SP11 SPI, .SP16 .SP112 的 
ADF 检 验尸 < 0.05, 因 此 可 进行 下 一 步 , 知 某 一 时 间 
尺度 P>0.05, 则 为 非 平 稳 时 间 序 列 ( 非 平 稳 时 间 序 
列 一 定 不 是 白 噪 声 序 列 ) , 需 利 用 差分 法 对 非 平稳 
时 间 序 列 进行 平稳 化 处 理 并 进行 单位 根 检验 ,经 检 
验 后 满足 P<0.05 则 可 用 上 自 相关 函数 (4CF) 及 偏 自 
相关 函数 (P4CP) 来 为 ARIMA 模型 定 阶 (图 4)。 由 
图 4 可 得 ,SP13 BB ACF 5 PACF 图 均 在 第 二 阶 之 后 
落 在 置信 区 间 ,而 其 余 3 个 时 间 尺 度 在 第 一 阶 之 后 
落 在 置信 区 间 上 ,因此 SP13 BS p 与 "可 取 值 有 0,1， 
2; 而 SP11 .SP16.SP112 的 p 与 "可 取 值 有 0 和 1。 


R2 单位 根 检验 
Tab.2 Unit root test 


时 间 xum o — BAE 00 y. 
尺度 检验 196 5% 10% 


SPI1 -20.3395 -3.4437 -2.8974 -2.5699 0.0 


SPIS -6.3567 -3.4729 -2.8802 -2.5767 mn 
SPI6 -6.9914 -3.5171 -2.8993 -2.5869 ca 
SPI12 -6.3198 -3.6103 -2.9391 一 2.0080 koa 


3.1.2 ARMA 模型 参数 估计 及 适用 性 检验 将 
上 一 步 通过 4CF 和 PACF 图 所 得 ARIMA(p,d,g) 的 
可 取 值 采用 AI1C、BIC 和 HOIC 准 则 来 选取 最 优 模型 ， 
其 结果 见 表 3。 由 表 3 可 得 ,SP11(1,0,0) SPRO, 
0, D .SPI6(0,0, D) fI SPIA2(1,0,0) 69 AIC, BIC 和 
FO1C 值 最 小 ,因此 判定 为 最 优 模型 。 而 QQ 图 和 正 
态 分 布 图 能 够 检验 模型 的 适用 性 ,从 图 5 和 图 6 可 
以 看 出 散 点 在 拟 合 线 附 近 , 且 残 差 也 满足 正 态 分 
布 , 青 结合 Ljung-Box 检 验 , 得 到 P 值 为 0.573 64 ,说 
明 残 差 符合 白 噪 声 ,模型 适用 于 SP 的 变化 趋势 。 


202011.00092v1 


chinaXiv 


自 相 关 ACF 


(a) SPI 1 


偏 自 相 关 PACF 


4 


6 


延迟 时 期 数 


(c) SPI 6 


自 相关 ACF 


偏 自 相关 PACF 


4 6 
延迟 时 期 数 


ChinaXiv 合 作 期 刊 


X + 
EXPE! 
1.0 (b) SPI 3 
Š 
zx 
AK 
E 
Jn 
Š 
& 
AR 
E 
1I 
1E : 
10 0 2 4 6 8 10 
延迟 时 期 数 
1.00 d) SPI 12 
: (d) 
< 
AR 
E 
1I 
e 
& 
AR 
E 
Jm 
1E 
10 0 2 4 6 8 10 
延迟 时 期 数 


图 4 4 个 时 间 斥 度 的 4CF PACF 图 
Fig.4 ACF and PACF diagram of four time scales 


RI ”模型 参数 检验 结果 


Tab.3 Test results of the model parameters 


(p,d,q) 


时 间 尺 度 项 目 


(0,0,0) (0,0,1) (0;052) C00) CEAR (10,1) (2,0,0) (2,0,1) (2,0,2) 
SPI 1 AIC 2 090.2 2 088.6 2 105.1 2 084.7 2 086.2 2 107.8 2 110.4 2 108.4 2 107.1 
BIC 2 099.4 2 102.5 2 202.6 2 079.4 2 099.4 2 203.1 2 210.0 2 204.9 2 202.9 
HQIC 2 093.7 2 093.9 2 291.2 2 081.6 2 093.7 2 291.3 2 298.8 2 294.1 2 292.4 
SPI 3 AIC 629.6 609.6 605.7 607.8 601.4 605.2 607.5 607.4 607.8 
BIC 636.6 620.2 619.9 621.9 618.7 622.9 623.1 625.1 629.1 
HQIC 632.4 613.8 611.4 613.5 610.8 612.3 612.9 614.5 616.3 
SPI 6 AIC 305.3 291.9 310.8 292.7 293.2 309.1 304.7 294.6 297.8 
BIC 311.1 301.4 321.4 304.1 304.5 317.4 310.0 308.9 310.4 
HQIC 307.6 296.3 313.7 201.3 297.8 322.4 308.7 300.4 299.1 
SPI 12 AIC 138.4 134.8 138.5 126.3 133.9 140.5 142.3 141.8 140.4 
BIC 142.7 141.2 141.7 137.0 142.5 154.7 151.7 149.4 145.0 
HQIC 140.1 137:3 142.3 130.5 137.3 149.5 149.5 145.6 148.3 


应 用 各 尺度 最 优 模 型 进行 预测 ,预测 结果 见 图 7, 图 
中 蓝 色 为 SPI 实 际 值 ,红色 为 SPI 预测 值 。 


3.2 LSTM 建 模 流程 


以 西宁 站 为 例 , 利 用 LSTM 模型 对 SP1L SPIS, 
SP16 和 SP112 的 ARIMA 模型 预测 残 差 值 进行 拟 合 


建 模 分 为 以 下 几 步 : 


C1) 输入 数据 的 预 处 理 


通常 ,神经 网 络 模型 处 理 的 数据 是 归 一 化 数 
据 ,范围 在 [-1,1j。 通 过 归 一 化 ,学 习 率 不 必 再 根 
据 数据 范围 进行 调整 ,提高 了 模型 的 训练 速度 。 

(2) 网 络 训练 

本 文 基于 Python3.7 平 台 来 搭建 LSTM 网 络 ,以 
西宁 站 4 个 时 间 尺 度 的 ARIMA 预测 SP7 值 的 残 差 为 
例 ,利用 箱 线 图 在 4 个 时 间 尺 度 上 直观 地 显示 LSTM 
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处 青海 省 为 例 


一 一 实际 分 布 
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图 6 和 残 差 正 态 分 布 图 


Fig. 6 Normal distribution map of residual 
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图 7 ARIMA 的 多 时 间 尺 度 SPI 值 的 预测 (1996 一 2017) 
Fig.7 Forecast of multi-time scale SPI value of ARIMA model (1996—2017) 


RI Zi 7G AACER 4 101: PISCIS] D 8 CE] 8) ,采用 黄 
金 分 割 法 来 选择 隐藏 层 神经 元 数量 。 如 图 8 所 示 ， 
当 隐 藏 层 数量 在 25 和 35 时 ,MSE 值 最 低 , 但 隐藏 层 
数量 越 高 ,模型 训练 时 间 越 长 ,因此 神经 元 隐藏 层 
数 选 取 25。 

(3) 网 络 输出 

由 于 数据 在 预 处 理 时 采用 归 一 化 处 理 , 因 此 对 
ARIMA 模型 残 差 预测 完毕 后 ,得 到 的 并 不 是 最 终结 
果 , 还 需 将 该 时 间 序 列 数 据 进 行 反 归 一 化 处 理 , 即 
得 到 模型 实际 输出 数据 。 
3.3 ARIMA-LSTM 组 合 模型 的 预测 

本 文选 取 1958 一 1996 年 4 个 时 间 尺 度 SPI 值 作 
为 训练 集 ,1996 一 2017 年 作为 测试 集 。 由 于 ARIMA 
模型 和 LSTM 模型 分 别 在 线性 和 非 线性 模型 中 各 有 
优势 ,因此 提出 ARIMA-LSTM 组 合 模型 ,结果 见 图 


9。 图 中 蓝 色 为 SPI 观 测 值 ,红色 为 ARIMA 预测 值 ， 
黑色 为 ARIMA-LSTM 组 合 预测 值 。 

由 于 SP7 在 不 同时 间 尺 度 适 用 于 不 同 种 类 的 干 
旱 ,3 个 月 以 下 用 于 基本 干旱 监测 ,6 个 月 以 下 ( 包 会 
3 个 月 )SPI 值 可 用 于 监测 农业 影响 , 旦 通常 大 部 分 
作物 生长 期 在 3~ 6 个 月 ,又 由 于 青海 省 干旱 在 四 季 
均 有 ,因此 结合 ArcGIS 强 大 的 空间 分 析 功 能 ,采用 
样 条 函数 插值 法 对 2017 年 的 各 模型 SP13 及 其 预测 
值 进行 空间 分 布展 示 ( 图 10)。 

RMSE、MAPE 和 RR 对 模型 的 评价 结果 见 表 4, 从 
表 中 数据 可 以 发 现 ARIMA 模 型 在 SP11 时间 尺度 的 
预测 精度 最 低 , YE SPI112 预测 精度 最 高 , ARI- 
MA-LSTM 组 合 模 型 在 各 个 时 间 尺 度 预测 精度 均 高 
于 单一 模型 。 
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Fig.8 Four time scale neurons hide the layers and the MSE values 
一 SPT 实 际 值 一 ARIMA 预 测 值 —- ARIMA-LSTM 预 测 值 
3[ (a) 月 尺度 20. DERE 
2r | 1.5 上 
t ill, "8 1.0 + 
- 1t | | 由 由 | ll Ak | h ML BU un Y cs 
2 MER A DLI [i | | A M. a UA. A ET 
5 oS Ai ARMAR ama UN ZR. 
Pm um | [| P -0.5 | 
ab qm eM | -10. 
-? 1996 2000 2004 2008 2012 2016 2020 L^ i906 2000 2004 2008 2012 2016 2020 
年 份 年 份 
20r ©) 半年 尺度 L5[ (d) 年 尺度 
1.5 F 1.07 
NEU a 95| 
z 05- a 
四 | & 0.0r 
-0.5L -0.5 
| 0 i ! l i -10r , i i i i i | 
1996 2000 2004 2008 2012 2016 2020 1996 2000 . 2004 2008 2012 2016 92020 
年 份 4E 
图 9 ARIMA 模 型 导 ARIMA-LSTM 组 合 模型 多 时 间 矿 度 SP7 信 的 预测 (1996 一 2017) 
Fig.9 Forecast of multi-time scale SPI value of ARIMA model and ARIMA-LSTM combined models 
证 指标 和 ArcGIS 进 行 评价 与 空间 分 布展 示 ,得 到 结 
结论 ' 
4 fà Ww 论 如 下 : 
本 文 分 别 利 用 ARIMA 模 型 和 ARIMA_-LSTM 模 (1) 从 图 9 和 表 4 可 得 ,ARIMA 模型 在 12 个 月 


结合 评价 验 。 时 间 尺 度 的 预测 精度 最 高 ,1 个 月 的 预测 精度 最 
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表 4 2 种 预测 模型 的 RRMSE 和 MAPE 值 低 , 并 且 随 着 时 间 尺 度 的 增加 ,预测 精度 逐渐 
Tab.4 R’, RMSE and MAPE values for two 增加 。 
prediction models 

时 间 尺度 。 预测 模型 R è RMSE MAPE (2)ARIMA-LSTM 组 合 模型 结合 了 线性 模型 和 

1 ARIMA 0.3648 1.2654 1.9722 非 线性 模型 的 优点 ,从 表 4 和 图 10 中 可 以 看 出 组 合 

ARIMA-LSTM 0.8874 — 0.1597 0.0401 模型 在 各 个 时 间 尺 度 的 预测 精度 均 高 于 单一 模型 ， 

MAIS DAMEN 说 明 组 合 模型 适用 于 多 尺度 SP1 值 的 预测 ,结合 GIS 

。 quss quus ami 强大 的 空间 分 析 功 能 ,对 2017 年 的 季 尺 度 SP1 值 及 

Dd 其 预测 值 进行 可 视 化 展示 ,发 现 组 合 模型 预测 值 相 

12 ARIMA 0.6501 — 0.2033 0.1207 比 于 单一 模型 在 空间 分 布 上 与 实际 值 最 为 接近 ,可 
ARIMA-LSTM 0.7744 — 0.1810 0.0803 为 有 关 部 门 防 旱 抗旱 提供 科学 依据 。 


(c) ARIMA-LSTM 预测 值 


(d) SP 三 实际 值 (e) ARIMA-- 预 测 值 (f) ARIMA-LSTM 预测 值 
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图 10 ARIMA 模 型 与 ARIMA-LSTM 组 合 模型 基于 季 尺 度 的 干旱 空间 分 布 
Fig. 10 Spatial distributions of seasonal drought levels in using the two forecasting models ARIMA and combined ARIMA-LSTM model 


(h) ARIMA- 预 测 值 


(k) ARIMA- 预 测 值 
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Application of a combined ARIMA-LSTM model based on SPI for 
the forecast of drought: A case study in Qinghai Province 
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2 North China University of Water Resources and Electric Power , Zhengzhou 450000 , Henan , China ) 


Abstract: Drought prediction is a precondition to effectively mitigate the risk of drought. Daily precipitation data 
obtained from 38 meteorological stations in Qinghai Province, China in the period from 1958 to 2017 were used to 
calculate the multiscale standardized precipitation index (SPI). In addition, based on these data, the SPI sequence 
Autoregressive Moving Average model ( ARIMA) , Long Short-Term Memory model (LSTM) , and ARIMA-LSTM 
combination model were constructed. After the calibration and verification of the model parameters, the model was 
used to predict multiscale SP/ values using the Xining area as a case study. Moreover, the validity of all the predic- 
tion models was determined by root mean square error (RMSE) and mean absolute percentage error (MAPE). The 
results indicated that the RMSE values of the ARIMA-LSTM combined model in SP/1 and SPI12 were 0.159 7 and 
0.181 0, respectively, which were lower than those (1.265 4 and 0.293 3) of the ARIMA model. This indicates that 
the prediction accuracy of the ARIMA and LSTM models for SPI was related to the timescale. Comparing the mea- 
sured data (using GIS) to the data predicted by the models, the combined ARIMA-LSTM model exhibited a higher 
prediction accuracy compared to the single ARIMA model. In addition, the combined ARIMA-LSTM model showed 
an ability to fit the SPI values of different timescales. 
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